让你的法律检索能力飞起来两大诀窍及三大方法,附33个常用的法律检索数据库(收藏贴)|能量星
这是熊猫能量星的第 66 篇文章
汇编丨熊猫小宝
编辑丨熊猫小宝
不管是诉讼律师还是非诉讼律师,其工作都是围绕事实和法律展开。因此法律检索是律师必须掌握的基本技能,没有好的法律检索技术,就难以全面了解和构建一个完备的法律适用体系,更无法准确预测裁决结果。
在大数据时代更是如此,要掌握命运,就必须通过过往数据还原历史真相,并从中找到通往未来的规律。而历史数据的取得更需要你有一流的检索技术。
今天熊猫小宝为大家整理了检索的关键词提取两大方法、两大诀窍,并与大家分享常用的33个检索数据库,精选9个相关文章,供大家学习参考。
在正式学习提取关键词的方法前,我们先了解一下检索的层次理论。根据搜索引擎使用能力和使用需求的高低,所有引擎日常使用情景可大致分为以下几个阶段:
第一阶段:会使用关键词
第二阶段:会使用关键词组配
第三阶段:会使用关键词+逻辑连接符
第四阶段:会使用关键词+逻辑连接符+检索命令
第一阶段和第二阶段的初级使用方法,一般用户都可以熟练掌握,在本文中,小宝与大家分享【三个检索的方法】(参见正文第一部分)。
我们更加需要练习并提高的是第三阶段和第四阶段的使用技能,我们将在【法律检索诀窍】部分教大家怎么混搭检索命令、逻辑符号和检索关键词。(参见正文第二部分)
学会第三、第四阶段的使用技能有什么好处?举个粟子就知道了:
你可以组合(“国际货物买卖合同“and”效力”)-无效filetype:doc之类的关键词去检索,搭建的层次越多,逻辑越合理,得到精准结果的可能性就越大。学会混搭检索命令、逻辑符号和检索关键词,检索就像探险一样,充满了无限的可能性。
很多搜索引擎提供了高级检索功能,利用高级检索功能进行限制检索,得到结果的准确性和关联度远比利用单一检索框要高。
此处,推荐阅读以下四个相关文章:
一、法律检索关键词提取的三大方法
那么,大家很关心的一个问题来了:提取检索关键有什么方法?今天推荐三个给大家!
方法一
常听人说,案例检索的“关键”就是关键词。也常常听同行抱怨,确定关键词是太复杂的一个过程,数据库选好了,在搜索栏却不知道该输入什么,或者是否已经穷尽答案。笔者以一简单民事诉讼案例,为大家介绍下一般情况下关键词的提取方法。
以上是笔者根据当事人的初次咨询口述,绘制的案件进展图(案例已经过适当调整)。那么,作为初次接触对此类案件,对法律关系等并不熟悉的律师,希望全面了解此类案件时,提炼关键词有以下几种方式:
(1)从当事人的口述中选择核心词汇
案例检索与法律法规检索的区别就在于,我们可以输入的并且在裁判文书中存在的“关键词”分布范围更广泛。例如,法律法规中不会出现的“跳单”“砍头息”等大量的存在于裁判文书中的词汇。而该等行为的法律适用及纠纷解决路径等,完全可以通过裁判文书的检索结果进行归纳、总结。
上图中案例的核心词汇为“银行卡、短信、挂失、报警”。输入威科先行数据库后,共取得604条结果,选取所有民事案件后发现基本均为银行卡纠纷、借记卡纠纷、信用卡纠纷或储蓄存款合同纠纷,粗略阅读十份左右会发现基本与本案事实类似,说明我们选取的关键词是准确的。
(2)将当事人口述的生活事实,结合初步证据材料,归纳为法律事实,再提炼核心词汇
通俗地说,就是什么法律主体持何物实施了(或未实施)何等法律行为,该等权益受损的法律主体的诉求又是什么。一般来说,当事人之间的法律关系在“本院认为”部分会被首先进行阐述。通过泛泛阅读数份裁判文书,基本可以归纳上图中纠纷发生的主体为持卡人与发卡银行,所谓的“物”的法律性质为借记卡,双方之间的法律关系为“储蓄存款合同”。那么输入“持卡人 发卡银行 借记卡”,共取得593份裁判文书,与上一步骤中所获得裁判文书数量及案件类型基本持平。
(3)关键词的关联与扩张
如输入过于精确的关键词,未找到相关案例,可以选择关联词、近义词或者更广范围的词汇。如,输入“过错”没有查找到,可以试试“过失”;再比如,我们想查找“飞单”的案例,但是输入关键词后发现没有此类裁判文书,那么就需要将“飞单”行为的模式拆分,尝试下“银行工作人员 私自 理财”等关键词的组合。有时候,关键词组合的顺序发生变化,检索结果都有可能不同。
(4)关键词与其他方法结合
案例检索有多种方法,除了单纯依靠关键词进行检索外,还可以尝试“法条链接法”“案由法”“文书分类法”等等。如图中案例,粗略阅读裁判文书后发现法院实体处理大多引用《合同法》第一百零七条以及《商业银行法》的有关规定,那么通过数据库的关联链接功能,在链接案例结果界面再输入关键词“借记卡”就可以获得大量与此相关的裁判文书。
另外,一些程序处理的问题如“管辖权异议成立”的案件等等,都可以通过法条链接的方法实现。而所谓案由法,实际上是根据双方之间的法律关系来确定的,案由方法在使用时有一些注意事项,篇幅所限不再赘述。
方法二
案例检索方法之关键词+检索条件
同类案例通过数据库检索的基本方法,是关键词+检索条件。
(1)关键词提取及转化
关键词此处特指在数据库检索文本框中输入的词汇。关键词的选取水平是检索能力高低的判断标准之一,也是对检索人员法律功底的考验。
关键词可来源于多种场合,如当事人口述或书面文件表述、证据标题、就该主题整理归纳的专业文章、相关法律规定表述、相关单一案例归纳等等。关键词不是单一的,但通常来讲单次检索在文本框中输入的关键词应不超过三个。
关键词除直接从文本中提取外,还可以根据相关度进行转化,如“差额补足”可直接转化为“差额支付”,“售后返租”可调整为“售后回租”,“SOP流程”调整为“规章制度”等。
(2)关键词的使用技术
在输入关键词时,除可选择“不包含”或使用检索逻辑符号外,还可试着使用定位检索或间隔检索等检索技术。如裁判文书网,在“全文检索”项下可选择“首部、事实、理由、判决结果、尾部”进行关键词定位检索。威科先行支持间隔检索及同段、同句检索,可将关键词有效衔接起来,缩小检索范围。
(3)检索条件的使用
检索条件主要是指数据库(包括裁判文书网)案例列表页左侧分类引导树,包括关键词(此处不是指在检索文本框中输入的关键词)、案由、法院层级、地域及法院、裁判年份、审理程序、文书种类七种分类引导,用以筛选所检索到的案例。
以上两大方法整理自曹会杰律师的作品(微信号:caohuijie003)
方法三
(1)关键词挑取的一般原则:特定性+一般性
关键词挑取过程中应注意“特定性+一般性”原则,简单说就是这个关键词必须是这类法律问题所特有的,同时也是这类法律问题一般具有的。
须注意的是,只要满足该条件的关键词均可,无论其是否为法律术语。比如,就学校宿舍中学生从上铺摔下的责任承担,最好的关键词应该是“上铺”这一生活用语。
(2)从法条或者案例中总结关键词
但是,即便明晰上述原则,检索关键词的挑取也是一项有赖于长期经验积累的技能。就此,个人认为,从法条或者案例中总结关键词亦是不错的选择。法律条文及法律文书中的用词均有很大的一致性,殆所谓“法言法语”也。
比如,《公司法》第一百四十八条规定:
董事、高级管理人员不得有下列行为:(一)挪用公司资金;(二)将公司资金以其个人名义或者以其他个人名义开立账户存储;(三)违反公司章程的规定,未经股东会、股东大会或者董事会同意,将公司资金借贷给他人或者以公司财产为他人提供担保;(四)违反公司章程的规定或者未经股东会、股东大会同意,与本公司订立合同或者进行交易;(五)未经股东会或者股东大会同意,利用职务便利为自己或者他人谋取属于公司的商业机会,自营或者为他人经营与所任职公司同类的业务;(六)接受他人与公司交易的佣金归为己有;(七)擅自披露公司秘密;(八)违反对公司忠实义务的其他行为。
董事、高级管理人员违反前款规定所得的收入应当归公司所有。
如果需要查找法定代表人私自存储公司资金的案例,检索的关键词应当是“将公司资金”+“以其个人名义”或者“以其他个人名义”+“存储”,而不应是“私自存储公司资金”等用词。
同样的,在检索上述的“股东是否能查阅会计凭证”这一问题中,应该以最高人民法院(2012)民申字第635号中出现的“会计凭证”作为关键词,而非其他关键词,比如“会计证明”等。
方法三整理至丁佳佳律师的作品(来源公众号:惟用法律自绳己)
二、法律检索两大诀窍
即便我们熟练地掌握了挑选关键词的技巧,尽可能缩小了需要查阅的文书范围,但是,在实践中,我们仍然会发现,所找资料不够精准,怎么办?这时,你需要进入正文开头提及的第三、第四阶段的学习!
今天,教你两个诀窍,把这两个诀窍与方法结合使用,有如虎添翼的功效!
诀窍1:搜索引擎逻辑运算符解析及使用
目前绝大部分数据库和搜索引擎均支持的逻辑运算符号为布尔逻辑运算符,由三个重要的逻辑符号组成:and, or,not。
在百度、搜狗、Bing和360搜索中,如关键词之间以空格隔开,默认的逻辑运算符即为and。所以,输入(合作办学and协议and效力)与输入(合作办学协议效力)的检索结果应该是一致的。
但如果使用多个不同的逻辑符号连接检索词,就像加减乘除的优先运算顺序不同一样,布尔逻辑符的优先运算顺序也有差异,其优先级排序为:not→and→or。此种情况下,为保证数据库按照用户需求准确检索,就需要利用布尔逻辑符构造检索表达式。目的在于缩小范围,快速定位。
(1)与→+
举例:公司法 +注册资本(同时涵盖公司法和注册资本两个概念)
(2)非→ -
举例:合同法 –劳动合同法(有合同法的概念,但排除劳动合同法)
(3)或→OR
举例:任志强 OR 潘石屹 –房地产(任或者潘,但是不要有房地产的概念)
诀窍2:基本的检索命令表达式解析及使用
搜索引擎在搜集相关信息的时候,抓取的信息维度很多面,学会基本的检索命令,可以有效解决综合搜索引擎反馈结果关联性不高的痛点,在此介绍几种最常用的检索命令,
1、双引号“”-完全匹配检索
现在多数数据库具有智能联想功能,为避免错误的智能联想和解构导致检索结果“答非所问”,就需要启用双引号“”精确检索命令。即将检索关键词放在双引号中,进行完全匹配搜索,这等于告诉搜索引擎,结果返回的页面必须与双引号中的内容完全一致,这么做的好处有三:
(1)避免不必要的自动联想。譬如输入lifugui,数据库可能以为用户要查找的是人名“李富贵”,进而智能地反馈以李富贵为关键词的检索结果。
(2)避免随意变换字母顺序,产生新的排列组合。比如想检索World IntellectualProperty Organization,如果不加引号,默认是and的关系,字母顺序是可以调换的,World Property Intellectual Organization就可能作为检索结果被反馈回来。
(3)避免被任意添加关键词。比如输入Emma Watsons,如果不加引号,搜索引擎可能反馈的结果中就包含了Emma bought tissues in Watsons这样的句子。
但要注意,在搜索地名、人名、机构名称和其他专有名称的时候,尽量使用双引号精确检索,避免进行二次繁复的结果筛查。
2、后缀词(一)→Site:
锁定哪一家网站、哪一类网站、哪个地区的网站,不少人 认为仅凭“site:”这一招,就能将检索效率成倍提升~
(注意此处为英文半角冒号,如无特殊提醒,下文提及的“:“均为英文半角冒号)
格式:
A:site:gov 关键词
B:关键词 site:gov
主要用途:
(1)可用于限制网站类型,学术资料在edu、org中会更精练,政府相关的在gov中也许更容易找;
(2)有的网站没有提供站内搜索,或者它的信息结构混乱,内容又多,不方便站内检索;
(3)搜索死链接网站、已关闭网站内的信息。
使用方法:
用于搜索结果局限于某个具体网站或者频道上
举例:
输入:律师 site:edu.cn,可搜索得到在中文教育网站中涵盖有律师内容的页面
3、后缀词(二)→Inurl:
搜索网址里面含有特定内容的关键词资源
格式:
A:inurl:court
B:inurl:court 关键词
C:关键词 inurl:court
主要用途:
与site类似,但是查询结果比site更精确,同时可替代filetype的使用。
4、后缀词四→intitle
标题中检索,指的是返回的结果是标题中包含指定关键词的网页。
格式:
intitle:关键词
举例:
如果要检索“预期违约”相关文章,如果直接以“预期违约”作为关键词进行检索,很可能找到一篇谈及不相干话题的长达几万字的论文,而其中仅出现了一次“预期违约”。
如果用“intitle:预期违约”作为关键词检索,得到的结果是标题中含有“预期违约”四个字的网页,相关性和精确度将大大提高。
5、后缀词五→filetype:
搜索文件的后缀名或扩展名
格式:
关键词 filetype:doc/pdf
现在很多纸质版本的材料均被电子化,如何找到某一特定类型的电子版本材料是重要的检索技能。“filetype:”即为限定文件格式检索。
譬如“合同法filetype:ppt”即检索文件类型为ppt,包含关键词合同法的相关内容。
很多人会问,直接以“关键词.ppt”的形式检索与用“filetype:”命令检索有何不同?如有此疑问,不妨以“经销商合同.pdf”与“经销商合同 filetype:doc”分别检索,前者搜索引擎反馈的内容包括但不限于pdf格式的文件,epub格式txt格式也会出现在结果之中,后者搜索引擎反馈的结果有且只有pdf格式。
具体使用指引及图示举例,以及更多的后缀词使用,可查看《大数据时代3分钟完成法律检索?你需要这份<法律人最全、最常用的检索内容和工具汇总>》一文,在此不重复解析!
三、33个常用的法律检索数据库
常言道,工欲善其事必先利其器,是否能够选择适合的法律检索工具是决定法律检索质量的关键点。关于常用的检索工具,熊猫法律星球号曾推出《33个法律检索资源库汇总,一键收藏贴|能量星》中总结了33个法律检索数据库。
附上常用的几个检索数据库的详细使用方法,供参考!
版权声明
本公众号所有原创文章或汇编作品如需转载请联系小编(微信号:xm-planet)授权,否则后果自负。
往期热文推荐
能量星|2017最新汇编:最高法院关于合同效力的8个裁判规则
能量星|美国资深律师经验:起草无可挑剔合同的7大步骤50大招
未来星|手把手教你大数据工具:一键采集分析法院观点,高效完成尽职调查…
未来星|人工智能代替人?未来面对与AI的竞争,你选择“每天吃鸡”,还是“星辰大海”?
生活星|熊猫校长:微信中令人反感的14个社交行为,你“中枪”了几条?